Home

Home

20.2.2 QLoRA와 GPTQ: 거대 모델의 효율적 파인튜닝과 배포

Home / 인공지능 (Artificial Intelligence, AI) / 제목: Embodied AI & Modern Control / Chapter 20. 파운데이션 모델의 경량화와 엣지 배포 (Efficient Deployment) / 20.2 모델 압축 기술: 양자화와 가지치기 (Model Compression: Quantization & Pruning) / 20.2.2 QLoRA와 GPTQ: 거대 모델의 효율적 파인튜닝과 배포

20.2.2 QLoRA와 GPTQ: 거대 모델의 효율적 파인튜닝과 배포

Generated by Rust Site Gen